Machine Learning Foundations - L3 Notes(上)

Contents

  1. 1. 前言
  2. 2. 一 Learning with Different Output Space
    1. 2.1. 一些問題分類
  3. 3. 二 Learning with Different Data Label
    1. 3.1. 一些學習方法
    2. 3.2. Reinforcement Learning
    3. 3.3. 總結

前言

章節名稱: types of learning

特別提醒一下,這個章節的很多名詞都可以去 Google 或 維基百科,可以得到更多有用的資訊!
機器學習 右側。

一 Learning with Different Output Space

從機器輸出 $y$ 的類型來說明不同種的問題。

一些問題分類

3-1-2

  • Binary Classification (二元分類): 也就是是非題

  • Multiclass Classification (多元分類): 可以看成選擇題,輸出可能有 K 種(二元分類 K = 2),例如:郵件分類、辨別圖片上的水果、銅板分類。

  • Regression (迴歸分析): 其輸出為實數空間,或某個實數範圍(bounded regression),例如:股票價格預測、天氣預測。

  • Structured Learning (Structured prediction): 舉例來說,將給定的句子當作輸入,分析每個詞的詞性,而因為所在位置或語意的不同,同樣的詞可能會有不同詞性。可把它看成一個很大的多元分類,底下的類別有某種結構上的關係。
    還有例如:蛋白質的分析,其構造哪邊彎哪邊折會有不同影響。

3-1-1

二 Learning with Different Data Label

從 Data 中的 $x_n$ 有沒有相對應的 $y_n$ ,來區別不同的學習。

一些學習方法

  • Supervised Learning (監督式學習): 資料中,對於給定的輸入 ($x_n$),有給予相對應的輸出 ($y_n$)。

    是一個機器學習中的方法,可以由訓練資料中學到或建立一個模式(函數 / learning model),並依此模式推測新的實例。訓練資料是由輸入物件(通常是向量)和預期輸出所組成。 - 維基百科

  • Unsupervised Learning (非監督式學習): 資料中不給予其類別,不曉得哪一個輸入是屬於哪一個類別。Cluster 是一個常見的 Unsupervised Learning。
    維基百科

Unsupervised Learning 資料中沒有 $y_n$ ,我們想要學到淺藏在下的 $y_n$ ,例如其機率函數,
以下是一些 Unsupervised Learning 的例子:

  • Clustering: 簡而言之的話就是分群

  • Density estimation: 想要知道輸入的這些點在哪些地方是比較稠密的,又或是比較稀疏的。

  • Outlier detection: 找出資料中有某些地方怪怪的,有點像是極值或異常值的概念。例如:流量異常。

3-2-1

相較之下 監督式學習 有較固定的標記與目標, 非監督式學習 的目標則比較分散,也就較難衡量其演算法的好壞。

而介於這兩者之中的是 :

  • Semi-supervised(半監督式學習) : 少部分已分好的標籤($y_n$)加上還沒有分類好的,兩者混再一起來做學習。對於替資料標記,可能需要很高的成本,對此我們可能就會替部分資料標記,來使用 半監督式學習。

可以看一下此投影片的三個統計圖:

3-2-2

Reinforcement Learning

這邊舉了小狗的例子,當我們對它命令 坐下 ($x_n$) ,牠不一定會乖乖聽話,說不定會有別的行為 ($y_n$),此時我們做的反應則是依據小狗的回應來給予相應的 懲罰(不好) 或 獎勵(好)。(不一定非坐下就給予懲罰)

這種方法稱作: Reinforcement Learning 強化學習 or 增強式學習。

這邊舉了兩個例子:

  • 廣告系統: 顧客是 輸入,廣告系統產生出的廣告位置是 輸出,而顧客是否點擊或讓你賺到錢則是放這個廣告的 好或不好

  • 玩牌: 手上的牌是 輸入,我們出的策略是 輸出,而最後賺到的錢或輸贏則是這個策略的 好或不好

與前面學習方法的差別,大致上是 我們靠的並不是 很直接 的輸出資訊,而是另外一個輸出和其好壞來進行學習的動作。而通常這種學習的動作會 序列 的發生,也就是一筆一筆的進行。

3-2-3

不一定是完全正確、最期待的輸出,我們或許還是會給予獎勵。

3-2-4

總結

我們總共提了4種不同的學習方式,而這些的核心是 Supervised Learning

3-2-5